# _*_ coding : utf-8 _*_
# @Time : 2022/1/11 19:12
# @Author : 01.requests.py
# @Project : 小猿圈爬虫--爬取搜狗首页页面数据
import json
import requests
if __name__ == '__main__':
    #step1 指定url
    url = 'https://movie.douban.com/j/chart/top_list'
    # UA伪装：将对应的User-Agent封装到一个字典中
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
    }
    # 处理url携带的参数：封装到字典中
    param = {
        'type': '24',
        'interval_id': '100:90',
        'limit': 50,#一次取出的个数
        'start': 0 #从库中的第几部电影开始去取
    }
    #step2 发起请求
    response = requests.get(url=url,params=param,headers=headers)

    # step3 获取响应数据: json()方法返回的是obj（如果确认响应数据是json类型的，才可以使用json()）
    list_data = response.json()

    #step4 持久化存储
    fp = open('./douban.json', 'w', encoding='utf-8')
    json.dump(list_data, fp=fp, ensure_ascii=False)

    print('爬取结束！！！')